import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.family'] = 'SimSun'
# 读取 CSV 文件
df = pd.read_csv("data/new_file.csv")

# 提取 fhjl_time 列的前四位数字并转换为字符串
df['fhjl_time'] = df['fhjl_time'].astype(str)
df['extracted_time'] = df['fhjl_time'].str[:4]

# 计算相同提取时间的 hk 的和
sum_hk_by_time = df.groupby('extracted_time')['hk'].sum()

# 绘制图形
plt.plot(sum_hk_by_time.index, sum_hk_by_time)
plt.xlabel('提取的时间前四位')
plt.ylabel('hk 的和')
plt.title('相同提取时间的 hk 的和')
plt.show()